Telegram Group & Telegram Channel
Что такое SMOTE (англ. Synthetic Minority Oversampling Technique) и как он работает?

Это метод искусственного увеличения числа примеров в классах с меньшим числом примеров. Используется для устранения дисбаланса классов, который может повлиять на производительность модели.

Алгоритм SMOTE примерно такой:
▪️Для каждого примера из меньшего класса находятся его k ближайших соседей (в пространстве признаков).
▪️Выбирается один из этих ближайших соседей случайным образом.
▪️Между выбранным примером и его соседом генерируется синтетический пример путём интерполяции. Если говорить подробнее, это выглядит так:
Находят разность d=Xb–Xa, где Xa и Xb — векторы признаков «соседних» примеров a и b. Далее из d путём умножения каждого его элемента на случайное число в интервале (0,1) получают d^. Вектор признаков нового примера вычисляется путём сложения Xa и d^.

#машинное_обучение
#статистика



tg-me.com/ds_interview_lib/232
Create:
Last Update:

Что такое SMOTE (англ. Synthetic Minority Oversampling Technique) и как он работает?

Это метод искусственного увеличения числа примеров в классах с меньшим числом примеров. Используется для устранения дисбаланса классов, который может повлиять на производительность модели.

Алгоритм SMOTE примерно такой:
▪️Для каждого примера из меньшего класса находятся его k ближайших соседей (в пространстве признаков).
▪️Выбирается один из этих ближайших соседей случайным образом.
▪️Между выбранным примером и его соседом генерируется синтетический пример путём интерполяции. Если говорить подробнее, это выглядит так:
Находят разность d=Xb–Xa, где Xa и Xb — векторы признаков «соседних» примеров a и b. Далее из d путём умножения каждого его элемента на случайное число в интервале (0,1) получают d^. Вектор признаков нового примера вычисляется путём сложения Xa и d^.

#машинное_обучение
#статистика

BY Библиотека собеса по Data Science | вопросы с собеседований


Warning: Undefined variable $i in /var/www/tg-me/post.php on line 283

Share with your friend now:
tg-me.com/ds_interview_lib/232

View MORE
Open in Telegram


Библиотека собеса по Data Science | вопросы с собеседований Telegram | DID YOU KNOW?

Date: |

The seemingly negative pandemic effects and resource/product shortages are encouraging and allowing organizations to innovate and change.The news of cash-rich organizations getting ready for the post-Covid growth economy is a sign of more than capital spending plans. Cash provides a cushion for risk-taking and a tool for growth.

Pinterest (PINS) Stock Sinks As Market Gains

Pinterest (PINS) closed at $71.75 in the latest trading session, marking a -0.18% move from the prior day. This change lagged the S&P 500's daily gain of 0.1%. Meanwhile, the Dow gained 0.9%, and the Nasdaq, a tech-heavy index, lost 0.59%. Heading into today, shares of the digital pinboard and shopping tool company had lost 17.41% over the past month, lagging the Computer and Technology sector's loss of 5.38% and the S&P 500's gain of 0.71% in that time. Investors will be hoping for strength from PINS as it approaches its next earnings release. The company is expected to report EPS of $0.07, up 170% from the prior-year quarter. Our most recent consensus estimate is calling for quarterly revenue of $467.87 million, up 72.05% from the year-ago period.

Библиотека собеса по Data Science | вопросы с собеседований from vn


Telegram Библиотека собеса по Data Science | вопросы с собеседований
FROM USA